🤖 reinforcement learning - ddboline · Scour

On Computation and Reinforcement Learning

arxiv.org·3d

🧩operations research

i10e-lab/HelloRL: A fully modular framework to make Reinforcement Learning quick and easy

github.com·2d·

Discuss: Hacker News

🧩operations research

Adaptive Neuro-Symbolic Planning for smart agriculture microgrid orchestration in hybrid quantum-classical pipelines

dev.to·20h·

Discuss: DEV

📊linear programming

Distributional Reinforcement Learning with Diffusion Bridge Critics

arxiv.org·3d

📊linear programming

On Economics of A(S)I Agents

lesswrong.com·1d

🧩operations research

Learning Models with Uniform Performance via Distributionally RobustOptimization

dev.to·1d·

Discuss: DEV

📊linear programming

Barn Owls Know When to Wait (iuSTDP part 2)

blog.typeobject.com·1d·

Discuss: Hacker News

📊linear programming

Quantization-Aware Distillation

ternarysearch.blogspot.com·1d·

Discuss: Hacker News

📊linear programming

LLMs Are Prediction Machines

kaelandt.github.io·10h·

Discuss: Hacker News

📊linear programming

I Let AI Agents Train Their Own Models. Here's What Actually Happened.

hamzamostafa.com·1h·

Discuss: Hacker News

🧩operations research

Oatmeal - Constraint propagation for fun

eli.li·1d·

Discuss: Lobsters, Hacker News

📊linear programming

OvidijusParsiunas/are-you-random: 🎲 Browser game that predicts your "random" choices

github.com·20h·

Discuss: Hacker News

📊linear programming

Continual learning and the post monolith AI era

baseten.co·2d·

Discuss: Hacker News

📊linear programming

An attempt at a First-Proof AI challenge

abhvio.us·18h·

Discuss: Hacker News

📊linear programming

Double Rootlessness: AI's Cognitive Illusion and Systemic Risk Amplification

news.ycombinator.com·5h·

Discuss: Hacker News

🧩operations research

Show HN: First AI Employee – Treat AI as a hire, not a chatbot

site-beige-ten.vercel.app·8h·

Discuss: Hacker News

📊linear programming

Routing in a Sparse Graph: a Distributed Q-Learning Approach

towardsdatascience.com·5d

📊linear programming

AI Workflows with human-in-the-loop

weavemind.ai·21h·

Discuss: Hacker News

🧩operations research

Human-like Search for Modern Applications

anvitra.ai·1d·

Discuss: Hacker News

📊linear programming

Show HN: Model Training Memory Simulator

czheo.github.io·20h·

Discuss: Hacker News

Loading more...